EvoClass
AI012
การสำรวจลึกถึงโมเดลภาษาขนาดใหญ่
การคิดวิเคราะห์ขั้นสูง การแก้ไขความรู้ และตรรกะทางคณิตศาสตร์
เป้าหมายการเรียนรู้
- วิเคราะห์และเปรียบเทียบแบบจำลองการคิด (CoT) ต่าง ๆ:แยกแยะความแตกต่างระหว่างสถาปัตยกรรมที่ใช้การคิดแบบมีความสม่ำเสมอ (Self-Consistency), โปรแกรมของความคิด (PoT), ต้นไม้แห่งความคิด (ToT), และกราฟแห่งความคิด (GoT)
- ประเมินเทคนิคการแก้ไขความรู้:เข้าใจเกณฑ์วัดผลด้านความน่าเชื่อถือ ความเฉพาะเจาะจง และความสามารถในการนำพา พร้อมแยกแยะความแตกต่างระหว่างแนวทางแก้ไขภายใน (ROME) และภายนอก (SERAC)
- ประเมินกระบวนการตรรกะทางคณิตศาสตร์:ระบุข้อมูลฝึกอบรม (GSM8K, MATH, AIME) และกระบวนการลดขนาด (distillation) ที่ใช้เพื่อพัฒนาความสามารถในการคิดเชิงตรรกะในรูปแบบยาวของโมเดล เช่น DeepSeek-Math และ o1